模式识别与人工智能
2025年4月6日 星期日   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2017, Vol. 30 Issue (5): 429-438    DOI: 10.16451/j.cnki.issn1003-6059.201705005
论文与报告 最新目录| 下期目录| 过刊浏览| 高级检索 |
基于对称不确定性和SVM递归特征消除的信息基因选择方法*
叶明全1,高凌云1,伍长荣2,万春圆1
1. 皖南医学院 计算机教研室 芜湖 241002
2. 安徽师范大学 数学计算机科学学院 芜湖 241003
Informative Gene Selection Method Based on Symmetric Uncertainty and SVM Recursive Feature Elimination
YE Mingquan1, GAO Lingyun1, WU Changrong2, WAN Chunyuan1
1.Department of Computer Science, Wannan Medical College, Wuhu 241002
2.School of Mathematics and Computer Science, Anhui Normal University, Wuhu 241003

全文: PDF (803 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 基因表达谱中存在大量与肿瘤分类无关的基因,严重降低肿瘤诊断的准确率.基因表达谱还存在高维小样本、噪声大等问题,增加肿瘤诊断的难度.为了获取基因数量较少且分类能力较强的信息基因子集,文中提出基于对称不确定性(SU)和支持向量机递归特征消除(SVM-RFE)的信息基因选择方法.首先利用SU评估基因和类标签之间的相关性,根据SU定义近似马尔科夫毯,快速消除大量无关和冗余基因.然后利用SVM-RFE进一步剔除冗余基因,获取有效的信息基因子集.实验表明,文中方法可以在选取维数较少或相等的信息基因子集情况下获取较高的肿瘤分类性能.
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
叶明全
高凌云
伍长荣
万春圆
关键词 基因选择 对称不确定性 支持向量机 递归特征消除 肿瘤分类    
Abstract:A large number of genes unrelated to tumor classification exist in gene expression profiles, and thus the prediction accuracy of tumor is reduced substantially. Due to the small sample size with high dimension and noise, the tumor diagnosis is harder. To get an informative gene subset with fewer genes and a better classification accuracy, an informative gene selection method based on symmetric uncertainty(SU) and support vector machine-recursive feature elimination(SVM-RFE) is proposed. Firstly, SU is used to evaluate the correlation between genes and class labels, and approximate Markov blanket is defined grounded on SU. The elimination of irrelevant and redundant genes is achieved. Secondly, SVM-RFE algorithm is applied to obtain the effective informative gene subset by further removing redundant genes. Experimental results show that the proposed algorithm produces higher classification performance with equal or less informative gene subset.
Key wordsGene Selection    Symmetric Uncertainty    Support Vector Machine    Recursive Feature Elimination    Tumor Classification   
收稿日期: 2017-01-01     
ZTFLH: TP 391  
基金资助:国家自然科学基金项目(No.61672386)、教育部人文社会科学研究规划基金项目(No.16YJAZH071)、安徽省自然科学基金项目(No.1708085MF142)、安徽高校省级自然科学研究重点基金项目(No.KJ2016A275,KJ2014A266)资助
作者简介: 叶明全(通讯作者),男,1973年生,博士,教授,主要研究方向为数据挖掘、机器学习、生物医学信息学、健康医疗大数据.E-mail:ymq@wnmc.edu.cn.
高凌云,女,1991年生,硕士研究生,主要研究方向为数据挖掘、机器学习、生物医学信息学.E-mail:anningxia55@163.com.
伍长荣,女,1973年生,硕士,副教授,主要研究方向为数据挖掘、机器学习、生物医学图像处理与分析.E-mail:wcr193@126.com.
万春圆,女,1993年生,硕士研究生,主要研究方向为数据挖掘、机器学习、生物医学图像处理与分析.E-mail:1312530104@qq.com.
引用本文:   
叶明全,高凌云,伍长荣,万春圆. 基于对称不确定性和SVM递归特征消除的信息基因选择方法*[J]. 模式识别与人工智能, 2017, 30(5): 429-438. YE Mingquan, GAO Lingyun, WU Changrong, WAN Chunyuan. Informative Gene Selection Method Based on Symmetric Uncertainty and SVM Recursive Feature Elimination. , 2017, 30(5): 429-438.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/10.16451/j.cnki.issn1003-6059.201705005      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2017/V30/I5/429
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn